bigram相关论文
在自然语言处理领域中,词和句子是最基本的表示单位。词是一种抽象的表示方法,往往包含多种含义,不同词间的关系也各不相同。句子......
We propose a multi-channel sliced deep Recurrent convolutional neural network (RCNN) with a residual network.We expand t......
音字转换在语音识别和汉字语句键盘输入方面都占有很重要的地位,现在比较流行的方法是基于大语料统计的Markov模型的音字转换方法,其中基于......
Chinese Phonetic-Character Conversion(CPCC) is an important issue in Chinese speech recognition and Chinese sentence key......
研究统计语言模型中bigram模型在自动文本分类中的应用,针对传统的向量空间模型在计算文本相似度时假设特征项相互独立的缺点,提出......
本文将部分语义信息加入到二元文法中,提出改进的二元文法索引策略。本文应用2-泊松模型的BM25公式在TREC公开数据集上进行了测试......
为通过构建高速的中文索引结构来提高Off-line模式的串匹配速度,提出了一种基于Bigram二级哈希的中文索引结构。该索引采用中文GB23......
利用隐马尔可夫模型(HMM)对英语文本进行词性标注,首先介绍了对Viterbi算法的改进和基于HMM模型方法训练机器的步骤,然后通过一系列对......
采用《汉语义词词林》和英汉双语语料库,通过“双语对齐”扩充了英汉词典的单记号译文;对大规模汉语语料库以B+树算法为骨架统计了双语......
用计算机信息处理技术实现文本自动分类是计算机自然语言理解学科共同关注的课题。该文提出了一种基于Bigram的无词典的中文文本特......
本文提出了一种利用句内相邻之间的互信息及t-测试差这两个统计量解决汉语自动分词中交集型歧义切分字段的方法。初步的实验结果显示......
计算语言学科虽然诞生的时间不长,但是近年来发展势头迅猛,已经渗入了如搜索引擎、数字图书馆等许多应用领域。以统计理论为基础建立......
中文分词的方法主要可分为基于规则和基于统计两大类:前者一般借助于词图的方法,将分词问题转化为最优路径问题,通常切分结果不惟一;后......
介绍了英汉机器翻译引擎的组成,详细描述了具体实现过程,包括翻译前的预处理、查词消兼、句法分析和转换生成。......
利用汉语语言的统计规律对汉语连续语音识别系统的声学到语音学的结果进行纠错及音字转换具有重要意义.本文介绍一个采用统计方法......